시각적 질의와 데이터 시각화
시각적 질의라는 관점에서, 어떻게 하면 데이터 시각화를 더 잘할 수 있는지 정리해보았다.
시각적 질의
예를 들어 상품별 매출액 데이터가 있다고 치자. 각 상품을 X축에 놓고, Y축은 매출액으로 하는 막대 그래프를 그리면…
매출에 가장 큰 기여를 한 상품과 가장 작은 기여를 한 상품의 차이는 몇 배인가?
라는 물음을 아래와 같은 시각적 질의로 바꿀 수 있다:
가장 긴 막대와 가장 짧은 막대의 차이는 몇 배인가?
또는, Visual thinking for design에 언급된 사례를 인용하자면:
위와 같이 해수의 온도를 색상으로(파란색이 낮은 온도), 해류의 속도를 올챙이 형태(굵고 길면 빠름)로 표현하면 “해류가 가장 빠른 곳은 어디인가?”라는 물음은 “가장 굵고 긴 올챙이가 어디있나?”라는 시각적 질의로 표현될 수 있다.
디자인(혹은 시각화)이 얼마나 잘 되어 있느냐에 따라 시각적 질의의 효율성에 큰 차이를 주게 된다.
데이터, 시각적 재료, 매핑
데이터에 대해 시각적 질의를 수행할 수 있게 한다는 것은 다시 말하면 데이터를 시각적 재료에 잘 매핑하는 것을 뜻한다.
시각적 재료란 다음과 같다:
- 형태
- 크기
- 색상
- 움직임
- 위치
- 질감(texture)
- (등등)
매핑이란 예를 들면 이런 뜻이다:
- 매출이 크면 긴 막대기로, 매출이 적으면 짧은 막대기로 표현 (매출을 막대 크기에 매핑)
- 서로 관련성이 깊은 데이터는 가까이에, 관련성이 낮은 데이터는 멀리 배치 (관련성을 위치에 매핑)
- (등등)
좋은 매핑은 효율적이고 정확한 시각적 질의를 돕는다
좋은 매핑이 있고 나쁜 매핑이 있다. 데이터를 아무 재료에나, 아무렇게나 매핑해서는 안된다. 좋은 매핑은 효율적이고 정확한 시각적 질의를 도와주는 매핑이다.
위에서 예를 들었던 막대 그래프 이야기를 해보자. 각 상품은 X축에 놓고, Y축은 매출액으로 하는 막대 그래프다.
가장 긴 막대와 가장 짧은 막대의 차이는 몇 배인가?
위 시각적 질의가 효율적이고 정확하게 처리되게 하려면 막대 그래프를 어떻게 그려야 하나? 예를 들어 각 막대 사이의 간격이 너무 멀면 시각적 질의의 효율성이 떨어진다. 혹은 세로축이 0에서 시작하지 않는다면 두 막대의 비율과 두 막대가 나타내는 숫자의 비율이 일치하지 않기 때문에 시각적 질의의 정확성이 떨어진다.
효율적인 매핑에 대한 좀 더 자세한 내용은 시각적 특성들을 효과적으로 쓰기, 특히 색상을 어떻게 활용할 것인가에 대해서는 데이터 시각화에서의 색상 활용을 참고.
요약
요약하자면 데이터를 시각적으로 표현하고자 할 때 최소한 다음 두가지를 반드시 고민해야 한다:
- 디자인이 지원해야 하는 인지적 과업들을 파악하고 각 과업의 우선순위를 정하기
- 위에서 정한 우선순위에 따라, 중요한 과업이 효율적이고 정확한 시각적 질의로 수행될 수 있도록 데이터를 시각적 재료에 적절히 매핑하기